1
패러다임 전환: 미세조정에서 프롬프트 추론으로
AI030Lesson 7
00:00

뇌를 조각하는 노동과 단순히 스크립트를 넘겨주는 것을 비교해 보세요. 이전 자연어 처리 시대에는 도메인 적응 은 고통스러운 과정이었습니다. 전이 학습 또는 PEFT(매개변수 효율적인 미세조정)모델을 점토처럼 여겼고, 내부 가중치를 물리적으로 수정하기 위해 수천 개의 레이블된 예제가 필요했습니다. 이 과정은 계산적으로 부담이 크며, BERT와 같은 정적이고 고도로 특화된 모델 버전을 만들어냈습니다.

전통적(가중치 중심)데이터 라벨링 + GPU수정된 ΔW현대적(맥락 중심)프롬프트 엔지니어링결속된 최첨단 모델전환: '뇌를 훈련시키는 것'에서 '뇌를 지시하는 것'으로

GPT-3의 촉매 효과

발표된 GPT-3최첨단(SOTA) 의 중요한 이정표였습니다. 그것은 맥락 내 학습—즉, 모델이 프롬프트에서 직접 패턴을 인식하는 방식—일반적인 작업에 대해 특화된 미세조정의 성능과 비슷하거나 이를 초월할 수 있음을 입증했습니다. 우리는 이제 프롬프트 기반 추론으로 전환했으며, 그라디언트 업데이트의 지연과 비용은 전략적인 맥락 주입으로 대체됩니다.

실제 사례
법률 분석기 구축은 과거에는 법원 판례에 대해 BERT를 수주간 미세조정해야 했습니다. 오늘날 개발자는 세 개의 예제 계약서를 포함한 프롬프트만 사용하여 결속된 대규모 언어 모델을 활용해 몇 분 만에 유사한 정확도를 달성합니다.